استخراج ویژگی های زمانی- فرکانسی از سیگنال های گفتار فارسی جهت بهبود کارایی یک سیستم vad برای ارتباط انسان و ربات
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
- نویسنده فهیمه جمهوری
- استاد راهنما حسین مروی علیرضا احمدی فرد
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1393
چکیده
استفاده از ربات های اجتماعی در زندگی انسان ها افزایش یافته است و اصلی ترین راه ارتباط انسان ها با آنها ارتباط کلامی است. ربات های اجتماعی دارای میکروفونی هستند تا بتوانند سیگنال گفتار را برای ارتباط با انسان دریافت کنند. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص قسمت های گفتار در سیگنال های صوتی ضبط شده می باشد. هدف این پایان نامه طراحی یک سیستم آشکارساز فعالیت گفتاری است که بتواند با مشخص نمودن بخش های گفتار در یک محیط نویزی کارایی یک سیستم پردازش گفتار مورد استفاده برای یک ربات اجتماعی را افزایش دهد. در این پایان نامه، ویژگی های مختلفی جهت استخراج از سیگنال گفتار برای سیستم آشکارساز فعالیت گفتاری پیشنهاد شده است. این ویژگی ها با استفاده از ترکیب ویژگی انرژی با هر یک از ویژگی های ضرایب کپسترال فرکانس مل ریشه، ضرایب کپسترال فرکانس بارک، ضرایب پیش بینی ادراکی خطی و ضرایب پیش بینی ادراکی خطی تجدید نظر شده ارائه شده اند. روش پیشنهادی دیگری که در این پایان نامه مطرح شده بر مبنای ویژگی ویگنر ویل به عنوان یک روش استخراج ویژگی زمانی-فرکانسی است. این روش در مقایسه با روش های پیشنهادی مبتنی بر ویژگی انرژی و ویژگی های کپسترال، کارایی بهتری دارد. بنابراین برای افزایش کارایی روش های مبتنی بر ویژگی های کپسترال علاوه بر ویژگی انرژی، با ویژگی ویگنر ویل نیز ترکیب شده اند. برای ارزیابی کارایی روش های پیشنهادی، دادگان گفتاری فارس دات که یک پایگاه داده استاندارد و به زبان فارسی می باشد، به کار رفته است. با افزودن چند نوع متفاوت نویز به فایل های این پایگاه داده در شرایط مختلف نسبت سیگنال به نویز، مقاومت روش های پیشنهادی نسبت به نویزهای متفاوت سنجیده شده اند. آزمایشات نشان داده اند که برخی از روش های استخراج ویژگی پیشنهادی در این پایان نامه در مقایسه با روش متداول استخراج ویژگی ضرایب کپسترال فرکانس مل در محیطهای نویزی کارایی بهتری دارند.
منابع مشابه
حذف خودکار آرتیفکت چشمی از سیگنال های مغزی با استفاده از ویژگی های آماری و زمانی- فرکانسی مولفه های مستقل
مهمترین مشکل در بررسی و پردازش ثبت های الکتروآنسفالوگرام (EEG) حضور انواع سیگنال های ناخواسته (آرتیفکت ها) است که حذف آنها با روش تحلیل مولفه های مستقل از بهترین گزینه های ممکن است. هدف مساله تحلیل مولفه های مستقل جداسازی کور ترکیبی خطی از منابع مستقل است. با اعمال این روش روی سیگنال های مغزی آغشته به آرتیفکت، آرتیفکت ها به صورت مولفه های مستقلی استخراج می شوند. تشخیص خودکار مولفه های مستقل مرب...
متن کاملاستخراج ویژگی زمانی- فرکانسی جهت شناسایی دیداری مصوت های فارسی
در این پایان نامه روشی برای شناسایی مصوت های فارسی در کلمات تک سیلابی ارائه می شود. برای این منظور پس از جداسازی فریم های تصویر و انتخاب فریم هایی که مربوط به تلفظ مصوت موجود در کلمه تک سیلابی بودند و نیز استخراج ناحیه ای پیرامون لب ها، ویژگی های مختلفی همچون ضرایب کسینوسی و ضرایب موجک و ضرایب mfcc برای تشخیص مصوت ها در کلمات تک سیلابی استخراج گردید. پس از آن توسط روش کاهش ویژگی lsda، ویژگی ها ...
بهبود آشکارسازی مؤلفة P300 با استفاده از تلفیق روشهای مختلف زمانی، فرکانسی و مکانیِ استخراج ویژگی
دراین مقاله سیستمی مبتنی بر بازشناسی آماری الگو جهت تفکیک سیگنالهای حاوی P300 و فاقد آن، ارائه میشود. این سیستم- که بر روی دادگان P300-Speller مسابقات BCI 2005 کار میکند- از چهار بخش اصلی پیشپردازش، استخراج ویژگی، انتخاب ویژگی و طبقهبند تشکیل شده که تأکید اصلی این مقاله بر بخش استخراج ویژگی و بررسی کارایی ویژگیهای مختلف است. در مرحلة استخراج ویژگی، شش دسته ویژگی شامل قطعهبندی هوشمند، ضرا...
متن کاملتشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...
متن کاملبهبود کیفیت گفتار مبتنی بر بهینهسازی ازدحام ذرات با استفاده از ویژگی های ماسک گذاری سیستم شنوائی انسان
چکیده: در این مقاله، روشهای دوکاناله جدید زیرفضایی سیگنال با استفاده از تکنیکهای حذف نویز ادراکی برای بهبود کیفیت سیگنال گفتار پیشنهاد شدهاند. روشهای پیشنهادی از مشخصات ماسکگذاری سیستم شنوایی انسان برای کاهش نویز باقیمانده قابلشنیدن بهره میگیرند. روش تجزیه به مقادیر منفرد کسری ادراکی، تکنیک بهینهسازی ذرات را برای تخمین نویز جمعی استفاده میکند. نتایج شبیهسازی دقیقی که توسط دو معیار مخ...
متن کاملاستخراج ویژگی های مقاوم از سیگنال گفتار
در این پایاننامه دو روش استخراج ویژگی جدید که برای بازشناسی گفتار مفید است، ارائه شده است. ایده اصلی این پایاننامه، ارائه یک ساختار منعطف برای بانک فیلتر میباشد که به دادههای آموزشی وابسته است. درحالیکه سایر روشهای استخراج ویژگی نظیر mfcc، ساختار بانک فیلتر ثابت و غیرمنعطفی را ارائه میدهند. برای پیادهسازی هر دو ایده، ابتدا، تعدادی فیلتر یکسان در نظر گرفته میشود. سپس، در روش اول، برمبنا...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023